Federica De Martin
15/02/2021
L’attuale epidemia di COVID-19 ha avuto un impatto senza precedenti nel settore del trasporto aereo.
A partire da fine Gennaio 2020 molte nazioni hanno cominciato a bloccare i voli provenienti da alcuni paesi dell’Asia e successivamente, con la diffusione della pandemia anche in Europa e in America, molti paesi occidentali hanno chiuso i confini nazionali bloccando anche i voli in partenza. Di conseguenza, l’aviazione è uno dei settore che più ha sofferto e soffre tutt’ora a causa delle conseguenze della pandemia. Secondo ACI World (Airport Council International, organizzazione fondata del 1991 per rappresentare gli interessi degli aeroporti presso i governi), nel 2020 c’è stata una riduzione del 64.2% (https://aci.aero/wp-content/uploads/2020/12/Advisory_Bulletin_The_impact_of_COVID_19_on_the_airport_business.pdf) del traffico passeggeri globale che corrisponde a oltre 6 miliardi di passeggeri in meno rispetto alle previsioni pre-Covid-19. Secondo cià che riporta International Air Transport Association le compagnie aeree hanno perso almeno 84,3 miliardi di dollari nel 2020 e nel 2021 ne perderanno almeno 15,8 miliardi.
In questo studio è analizzata una rete di trasporto aereo con dati riferiti ai mesi di Gennaio, Febbraio e Marzo 2020 e l’impatto che il COVID-19 ha avuto su tale rete.
Il dataset scelto è stato creato da Xavier Olive, Martin Strohmeier e Jannis Lübbe a partire da dati derivati dalla piattaforma The OpenSky Network 2020 con l’obiettivo di illustrare la variazione del traffico aereo durante la pandemia COVID-19.
Il dataset è organizzato in un file .csv per ogni mese, ogni riga del file contiene le informazioni su un specifico volo. Ogni file .csv contiene i seguenti attributi:
I tre dataset riferiti ai mesi di gennaio, febbraio e marzo 2020 devono essere uniti in un unico dataset chiamato df_flight_covid.
## # A tibble: 3,921,109 x 16
## callsign number icao24 registration typecode origin destination
## <chr> <chr> <chr> <chr> <chr> <chr> <chr>
## 1 THY183 <NA> 4ba9c1 TC-JNA A332 <NA> LTBW
## 2 CES771 MU771 781858 B-30CW A359 YSSY EHAM
## 3 ACA43 <NA> c0173f C-FIUW B77W CYYZ CYYZ
## 4 CCA985 CA985 780cb6 B-2485 B748 <NA> KSFO
## 5 ETH726 <NA> 040087 ET-ARE B788 SBGR LOWW
## 6 FJI911 FJ911 c8809d DQ-FAJ A359 KLAX YSSY
## 7 HVN11 VN11 888152 VN-A896 A359 <NA> LFPG
## 8 UAE363 <NA> 8960e4 A6-EDC A388 OMDB OMDB
## 9 VOI938 Y4938 0d036e XA-VOI A319 KLAX KPDX
## 10 CSN399 <NA> 780f16 B-7185 B77W <NA> KJFK
## # … with 3,921,099 more rows, and 9 more variables: firstseen <dttm>,
## # lastseen <dttm>, day <dttm>, latitude_1 <dbl>, longitude_1 <dbl>,
## # altitude_1 <dbl>, latitude_2 <dbl>, longitude_2 <dbl>, altitude_2 <dbl>
Il dataset risultante è formato da 3.921.109 entries e 16 attributi.
Per l’analisi della rete dei voli è essenziale conoscere l’aeroporto di orgine e di destinazione del volo; nel dataset df_flight_covid ci sono 1.600.122 voli con orgine e/o destinazione sconosciuta, questi voli non possono essere considerati per l’analisi e vanno eliminati. Il nuovo dataset ottenuto ha 2.320.987 entries.
Le varibili icao24, registration, typecode e number non sono d’interesse per l’analisi e possono essere eliminate.
Le variabili firstseen e lastseen possono essere rappresentate dalla variabile day e quindi possono essere rimosse dal dataset.
Per identificare univocamente un volo è stato aggiunto un id.
Gli attributi relativi a latitudine, longitudine e altitudine del primo e ultimo contatto non sono rilevanti e possono essere eliminati.
Il dataset ottenuto ha 5 attributi: id, callsign, origin, destination e day.
## # A tibble: 2,320,987 x 5
## id callsign origin destination day
## <dbl> <chr> <chr> <chr> <dttm>
## 1 1 CES771 YSSY EHAM 2020-01-01 00:00:00
## 2 2 ACA43 CYYZ CYYZ 2020-01-01 00:00:00
## 3 3 ETH726 SBGR LOWW 2020-01-01 00:00:00
## 4 4 FJI911 KLAX YSSY 2020-01-01 00:00:00
## 5 5 UAE363 OMDB OMDB 2020-01-01 00:00:00
## 6 6 VOI938 KLAX KPDX 2020-01-01 00:00:00
## 7 7 UBG315 WMKK WMKK 2020-01-01 00:00:00
## 8 8 VOI950 KLAX KFAT 2020-01-01 00:00:00
## 9 9 SVA834 WMKK WMKK 2020-01-01 00:00:00
## 10 10 ACA848 VHHH EGLL 2020-01-01 00:00:00
## # … with 2,320,977 more rows
Per poter eseguire l’analisi sulla rete dei voli è necessario individuare la nazione (e continente) di partenza e di arrivo del volo. Queste informazioni possono essere ricavate a partire dalle sigle degli aeroporti di partenza e di arrivo se si ha a disposizione un dataset che mappa tali sigle nelle nazioni di appartenenza dell’aeroporto. Gli aeroporti sono identificati dalla sigla ICAO che è un codice aeroportuale di quattro lettere utilizzato per indicare ogni aeroporto nel mondo. Un dataset del genere non è scaricabile gratuitamente perciò è stato costruito manualmente a partire dalle informazioni in formato JSON presenti nel sito datahub.io.
Il dataset creato icao_codes ha 57.421 entries ed è caratterizzato dai seguenti 12 attributi:
Di questi attributi sono necessari solo: ident, continent, iso-country e coordinates.
## # A tibble: 57,421 x 12
## ident type name elevation_ft continent iso_country iso_region municipality
## <chr> <chr> <chr> <dbl> <chr> <chr> <chr> <chr>
## 1 00A heli… Tota… 11 <NA> US US-PA Bensalem
## 2 00AA smal… Aero… 3435 <NA> US US-KS Leoti
## 3 00AK smal… Lowe… 450 <NA> US US-AK Anchor Point
## 4 00AL smal… Epps… 820 <NA> US US-AL Harvest
## 5 00AR clos… Newp… 237 <NA> US US-AR Newport
## 6 00AS smal… Fult… 1100 <NA> US US-OK Alex
## 7 00AZ smal… Cord… 3810 <NA> US US-AZ Cordes
## 8 00CA smal… Gold… 3038 <NA> US US-CA Barstow
## 9 00CL smal… Will… 87 <NA> US US-CA Biggs
## 10 00CN heli… Kitc… 3350 <NA> US US-CA Pine Valley
## # … with 57,411 more rows, and 4 more variables: gps_code <chr>,
## # iata_code <chr>, local_code <chr>, coordinates <chr>
Attraverso il join tra tra il dataset dei voli df_flight_covid e quello degli aeroporti icao_codes è possibile ricavare la posizione degli aeroporti di partenza e di arrivo per ogni volo (stato e continente).
Il dataset finale ottenuto, df_flights_airports, è formato da 2.315.324 entries e contiene i seguenti attributi:
In questo dataset c’è un problema: la sigla per il Nord America (NA) viene letta come NA (not available), è quindi necessario riscrivere tali valori.
## # A tibble: 2,315,324 x 11
## id callsign origin destination day continent_origin
## <dbl> <chr> <chr> <chr> <dttm> <chr>
## 1 1 CES771 YSSY EHAM 2020-01-01 00:00:00 OC
## 2 2 ACA43 CYYZ CYYZ 2020-01-01 00:00:00 NA
## 3 3 ETH726 SBGR LOWW 2020-01-01 00:00:00 SA
## 4 4 FJI911 KLAX YSSY 2020-01-01 00:00:00 NA
## 5 5 UAE363 OMDB OMDB 2020-01-01 00:00:00 AS
## 6 6 VOI938 KLAX KPDX 2020-01-01 00:00:00 NA
## 7 7 UBG315 WMKK WMKK 2020-01-01 00:00:00 AS
## 8 8 VOI950 KLAX KFAT 2020-01-01 00:00:00 NA
## 9 9 SVA834 WMKK WMKK 2020-01-01 00:00:00 AS
## 10 10 ACA848 VHHH EGLL 2020-01-01 00:00:00 AS
## # … with 2,315,314 more rows, and 5 more variables: country_origin <chr>,
## # coordinates_origin <chr>, continent_dest <chr>, country_dest <chr>,
## # coordinates_dest <chr>
Come prima analisi è stata eseguita un’analisi espolorativa del dataset df_flights_airports.
## [1] "Numero di aeroporti presenti nel dataset: 5330"
## [1] "Numero di nazioni nel dataset: 106"
## [1] "Numero di voli internazionali registrati: 711780"
## [1] "Numero di voli intercontinentali registrati: 176150"
## [1] "Numero di voli nazionali registrati: 1603544"
È interessante capire quali sono le nazioni con più voli in partenza e in arrivo e quelle con meno voli in partenza e in arrivo. Successivamente, per ognuna delle nazioni trovate è ricavato il numero di aeroporti di quel paese presenti nel dataset.
## # A tibble: 6 x 4
## # Groups: country_origin [6]
## country_origin totale_voli nazione n_aeroporti
## <chr> <int> <chr> <int>
## 1 US 1380418 USA 3909
## 2 DE 100559 Germania 69
## 3 AU 73172 Australia 88
## 4 CA 68274 Canada 141
## 5 GB 63180 Gran Bretagna 63
## 6 IN 60409 India 41
## # A tibble: 6 x 4
## # Groups: country_origin [6]
## country_origin totale_voli nazione n_aeroporti
## <chr> <int> <chr> <int>
## 1 ML 6 Mali 1
## 2 AZ 5 Azerbaigian 1
## 3 GT 5 Guatemala 1
## 4 MR 3 Mauritania 1
## 5 CY 2 Cipro 2
## 6 UY 1 Uruguai 1
## # A tibble: 6 x 4
## # Groups: country_dest [6]
## country_dest totale_voli nazione n_aeroporti
## <chr> <int> <chr> <int>
## 1 US 1380459 USA 3909
## 2 DE 98729 Germania 69
## 3 AU 73064 Australia 88
## 4 CA 67438 Canada 141
## 5 GB 62114 Gran Bretagna 63
## 6 IN 60319 India 41
## # A tibble: 6 x 4
## # Groups: country_dest [6]
## country_dest totale_voli nazione n_aeroporti
## <chr> <int> <chr> <int>
## 1 AZ 6 Azerbaigian 1
## 2 MR 5 Mauritania 1
## 3 KW 2 Kuwait 1
## 4 OM 2 Oman 1
## 5 EG 1 Egitto 1
## 6 SY 1 Siria 1
L’organizzazione mondiale della sanità (WHO) l’11 Marzo dichiara la pandemia.
Un valore anomalo si verica il 18/01/2020 in cui si nota una diminuzione significativa di voli, non è chiaro cosa abbia causato questa diminuzione di voli. Un’ipotesi è che questo valore potrebbe essere una conseguenza dell’attività di pulizia del dataset.
Qual è il giorno con più voli? Il 14 febbraio sono stati effettuati 31459 voli, in questo periodo i peasi occidentali non avevano ancora adottato misure di lockdown.
## # A tibble: 1 x 2
## # Groups: day [1]
## day voli_giornalieri
## <dttm> <int>
## 1 2020-02-14 00:00:00 31459
## # A tibble: 1 x 2
## # Groups: day [1]
## day voli_giornalieri
## <dttm> <int>
## 1 2020-03-30 00:00:00 9209
Per avere poter effettuare un confronto sui mesi di Gennaio, Febbraio, Marzo 2019 e 2020, è stato creato un ulteriore dataset df_flights_airports_2019 con le stesse procedure effettuate per la creazione del dataset per i voli del 2020. Il grafico del 2019 ha in media un numero minore di voli giornalieri (probabilmente dovuto all’attività di raccolta di dati) ma l’andamento non evidenzia significative diminuzioni, cosa che invece è evidente per il 2020.
È possibile utilizzare queste informazioni sui voli per creare un grafo diretto in cui i nodi sono gli aeroporti e gli archi sono i voli tra due aeroporti. Il grafo ottenuto ha 5330 nodi(il numero degli aeroporti) e 2.315.324 archi (ovvero il numero di righe del dataset df_flights_airports_coordSep).
Su questo grafo sono state misurate tre misure di centralità dei nodi: in degree, out_degree e betweenness. * Quali sono gli aeroporti con un grado maggiore, ovvero quelli a cui arrivano e partono più voli?
Per rispondere a questa domanda è necessario calcolare la centralità di grado: in_degree indica il numero di voli che arrivano a un aeroporto (la popolarità dell’aeroporto) e out_degree rappresenta il numero di voli che partono da ogni aeroporto.
## # A tibble: 5,330 x 3
## aeroporto in_degree out_degree
## <chr> <dbl> <dbl>
## 1 YSSY 20870 21946
## 2 CYYZ 24680 25986
## 3 SBGR 4674 5068
## 4 KLAX 46795 54705
## 5 OMDB 14213 16084
## 6 WMKK 14154 14146
## 7 VHHH 16558 17238
## 8 YPPH 4733 4752
## 9 WSSS 13601 16623
## 10 KCVG 8695 13978
## # … with 5,320 more rows
Quali sono gli aeroporti più popolari per i voli in arrivo, ovvero con in_degree maggiore? Gli aeroporti più popolari si trovano tutti negli Stati Uniti.
## # A tibble: 10 x 5
## aeroporto in_degree name iso_country municipality
## <chr> <dbl> <chr> <chr> <chr>
## 1 KORD 68001 Chicago O'Hare International … US Chicago
## 2 KATL 61270 Hartsfield Jackson Atlanta In… US Atlanta
## 3 KLAX 46795 Los Angeles International Air… US Los Angeles
## 4 KDFW 45474 Dallas Fort Worth Internation… US Dallas-Fort W…
## 5 KPHX 39664 Phoenix Sky Harbor Internatio… US Phoenix
## 6 KSFO 35654 San Francisco International A… US San Francisco
## 7 KLAS 34910 McCarran International Airport US Las Vegas
## 8 KBOS 34360 General Edward Lawrence Logan… US Boston
## 9 KEWR 34143 Newark Liberty International … US Newark
## 10 KSEA 33631 Seattle Tacoma International … US Seattle
Distribuzione di in_degree: 62 aeroporti hanno un in_degree superiore a 10.000 mentre i rimanenti 5268 hanno un in_degree inferiore a 10.000.
* Quali sono gli aeroporti più popolari per i voli in partenza, ovvero con out_degree maggiore? 1154 aeroporti hanno un out_degree superiore a 10.000.
## # A tibble: 10 x 5
## aeroporto out_degree name iso_country municipality
## <chr> <dbl> <chr> <chr> <chr>
## 1 KORD 72575 Chicago O'Hare International… US Chicago
## 2 KATL 68496 Hartsfield Jackson Atlanta I… US Atlanta
## 3 KLAX 54705 Los Angeles International Ai… US Los Angeles
## 4 KDFW 50718 Dallas Fort Worth Internatio… US Dallas-Fort W…
## 5 KDEN 45810 Denver International Airport US Denver
## 6 KPHX 41341 Phoenix Sky Harbor Internati… US Phoenix
## 7 KLAS 36573 McCarran International Airpo… US Las Vegas
## 8 KSFO 36001 San Francisco International … US San Francisco
## 9 KBOS 35693 General Edward Lawrence Loga… US Boston
## 10 KSEA 35654 Seattle Tacoma International… US Seattle
Distribuzione di out_degree: I 4 aeroporti più popolari sia per in_degree che per out_degree sono: Chicago O’Hare International Airport, Hartsfield Jackson Atlanta International Airport, Los Angeles International Airport e Dallas Fort Worth International Airport. Questi aeroporti corrispondono agli [scali più trafficati] (https://it.ripleybelieves.com/busiest-airports-in-united-states-by-passenger-traffic-7219) degli Stati Uniti.
Quali sono gli aeroporti di transito? Per rispondere a questa domanda è necessario calcolare la betweenness centrality.
## # A tibble: 10 x 5
## aeroporto btw name iso_country municipality
## <chr> <dbl> <chr> <chr> <chr>
## 1 KORD 1.99e6 Chicago O'Hare International Ai… US Chicago
## 2 KATL 1.37e6 Hartsfield Jackson Atlanta Inte… US Atlanta
## 3 KDFW 1.29e6 Dallas Fort Worth International… US Dallas-Fort W…
## 4 KMSP 6.49e5 Minneapolis-St Paul Internation… US Minneapolis
## 5 KLAX 6.49e5 Los Angeles International Airpo… US Los Angeles
## 6 EDDF 6.01e5 Frankfurt am Main Airport DE Frankfurt am …
## 7 KPHL 5.96e5 Philadelphia International Airp… US Philadelphia
## 8 KIAH 5.73e5 George Bush Intercontinental Ho… US Houston
## 9 KCLT 5.70e5 Charlotte Douglas International… US Charlotte
## 10 KEWR 5.22e5 Newark Liberty International Ai… US Newark
Le misure di centralità fin’ora calcolate si basano su tutto il periodo Gennaio-Marzo 2020. Calcolando le misure di centralità nei singoli mesi è possibile osservare come queste sono cambiate (diminuite) con l’inizio della pandemia. Come sono variate le misure di centralità di Gennaio e di Marzo, ovvero prima e dopo l’inizio della pandemia?
## # A tibble: 10 x 5
## aeroporto in_degree name iso_country municipality
## <chr> <dbl> <chr> <chr> <chr>
## 1 KORD 23472 Chicago O'Hare International … US Chicago
## 2 KATL 21993 Hartsfield Jackson Atlanta In… US Atlanta
## 3 KLAX 16189 Los Angeles International Air… US Los Angeles
## 4 KDFW 15465 Dallas Fort Worth Internation… US Dallas-Fort W…
## 5 KPHX 13501 Phoenix Sky Harbor Internatio… US Phoenix
## 6 KLAS 12899 McCarran International Airport US Las Vegas
## 7 KSFO 12630 San Francisco International A… US San Francisco
## 8 KEWR 12362 Newark Liberty International … US Newark
## 9 EGLL 12271 London Heathrow Airport GB London
## 10 KBOS 12248 General Edward Lawrence Logan… US Boston
## # A tibble: 10 x 5
## aeroporto in_degree name iso_country municipality
## <chr> <dbl> <chr> <chr> <chr>
## 1 KORD 20914 Chicago O'Hare International … US Chicago
## 2 KATL 17951 Hartsfield Jackson Atlanta In… US Atlanta
## 3 KLAX 14436 Los Angeles International Air… US Los Angeles
## 4 KDFW 14388 Dallas Fort Worth Internation… US Dallas-Fort W…
## 5 KPHX 12739 Phoenix Sky Harbor Internatio… US Phoenix
## 6 KSFO 10543 San Francisco International A… US San Francisco
## 7 KSEA 10374 Seattle Tacoma International … US Seattle
## 8 KBOS 10253 General Edward Lawrence Logan… US Boston
## 9 KEWR 9798 Newark Liberty International … US Newark
## 10 KLAS 9721 McCarran International Airport US Las Vegas
## # A tibble: 3,539 x 6
## aeroporto name municipality in_degreeGennaio in_degreeMarzo var
## <chr> <chr> <chr> <dbl> <dbl> <dbl>
## 1 LPAR Alverca Air Ba… Vila Franca … 877 0 -100
## 2 OLBA Beirut Rafic H… Beirut 756 0 -100
## 3 KPWA Wiley Post Air… Oklahoma City 732 0 -100
## 4 MMUN Cancún Intern… Cancún 511 0 -100
## 5 SEHI Cotachachi Air… Cotacachi 395 0 -100
## 6 KCAE Columbia Metro… Columbia 368 0 -100
## 7 KTIK Tinker Air For… Oklahoma City 206 0 -100
## 8 RJOT Takamatsu Airp… Takamatsu 187 0 -100
## 9 MMCZ Cozumel Intern… Cozumel 163 0 -100
## 10 KN52 Jaars Townsend… Waxhaw 122 0 -100
## # … with 3,529 more rows
## # A tibble: 10 x 5
## aeroporto out_degree name iso_country municipality
## <chr> <dbl> <chr> <chr> <chr>
## 1 KORD 25124 Chicago O'Hare International… US Chicago
## 2 KATL 24485 Hartsfield Jackson Atlanta I… US Atlanta
## 3 KLAX 19206 Los Angeles International Ai… US Los Angeles
## 4 KDFW 17178 Dallas Fort Worth Internatio… US Dallas-Fort W…
## 5 KDEN 15770 Denver International Airport US Denver
## 6 KCLT 14313 Charlotte Douglas Internatio… US Charlotte
## 7 KPHX 14014 Phoenix Sky Harbor Internati… US Phoenix
## 8 KLAS 13669 McCarran International Airpo… US Las Vegas
## 9 KBOS 12723 General Edward Lawrence Loga… US Boston
## 10 KSFO 12703 San Francisco International … US San Francisco
## # A tibble: 10 x 5
## aeroporto out_degree name iso_country municipality
## <chr> <dbl> <chr> <chr> <chr>
## 1 KORD 22299 Chicago O'Hare International… US Chicago
## 2 KATL 20201 Hartsfield Jackson Atlanta I… US Atlanta
## 3 KLAX 16660 Los Angeles International Ai… US Los Angeles
## 4 KDFW 16185 Dallas Fort Worth Internatio… US Dallas-Fort W…
## 5 KDEN 14221 Denver International Airport US Denver
## 6 KPHX 13311 Phoenix Sky Harbor Internati… US Phoenix
## 7 KSEA 10958 Seattle Tacoma International… US Seattle
## 8 KSFO 10811 San Francisco International … US San Francisco
## 9 KBOS 10365 General Edward Lawrence Loga… US Boston
## 10 KEWR 10322 Newark Liberty International… US Newark
## # A tibble: 1,894 x 6
## aeroporto name municipality out_degreeGenna… out_degreeMarzo var
## <chr> <chr> <chr> <dbl> <dbl> <dbl>
## 1 OLBA Beirut Rafic … Beirut 700 0 -100
## 2 KCAE Columbia Metr… Columbia 413 0 -100
## 3 KOKC Will Rogers W… Oklahoma City 256 0 -100
## 4 RJOT Takamatsu Air… Takamatsu 196 0 -100
## 5 LTBW İstanbul Hez… Istanbul 156 0 -100
## 6 MMCZ Cozumel Inter… Cozumel 139 0 -100
## 7 MMUN Cancún Inter… Cancún 121 0 -100
## 8 VOTV Trivandrum In… Thiruvananth… 109 0 -100
## 9 KTIK Tinker Air Fo… Oklahoma City 99 0 -100
## 10 SEAS Ascazubi Airp… Ascazubi 93 0 -100
## # … with 1,884 more rows
## # A tibble: 10 x 5
## aeroporto btw name iso_country municipality
## <chr> <dbl> <chr> <chr> <chr>
## 1 KORD 1.13e6 Chicago O'Hare International Ai… US Chicago
## 2 KATL 7.92e5 Hartsfield Jackson Atlanta Inte… US Atlanta
## 3 KDFW 6.31e5 Dallas Fort Worth International… US Dallas-Fort W…
## 4 KPHL 3.79e5 Philadelphia International Airp… US Philadelphia
## 5 KMSP 3.67e5 Minneapolis-St Paul Internation… US Minneapolis
## 6 KLAX 3.41e5 Los Angeles International Airpo… US Los Angeles
## 7 KCLT 3.37e5 Charlotte Douglas International… US Charlotte
## 8 EDDF 3.33e5 Frankfurt am Main Airport DE Frankfurt am …
## 9 KEWR 3.31e5 Newark Liberty International Ai… US Newark
## 10 EGLL 2.95e5 London Heathrow Airport GB London
## # A tibble: 10 x 5
## aeroporto btw name iso_country municipality
## <chr> <dbl> <chr> <chr> <chr>
## 1 KORD 1.04e6 Chicago O'Hare International Ai… US Chicago
## 2 KATL 6.64e5 Hartsfield Jackson Atlanta Inte… US Atlanta
## 3 KDFW 6.35e5 Dallas Fort Worth International… US Dallas-Fort W…
## 4 EDDF 3.53e5 Frankfurt am Main Airport DE Frankfurt am …
## 5 KLAX 3.48e5 Los Angeles International Airpo… US Los Angeles
## 6 EGLL 3.00e5 London Heathrow Airport GB London
## 7 KCLT 2.79e5 Charlotte Douglas International… US Charlotte
## 8 KPHL 2.64e5 Philadelphia International Airp… US Philadelphia
## 9 KBOS 2.61e5 General Edward Lawrence Logan I… US Boston
## 10 KMSP 2.44e5 Minneapolis-St Paul Internation… US Minneapolis
## # A tibble: 4 x 6
## aeroporto name municipality btw_Gennaio btw_Marzo var
## <chr> <chr> <chr> <dbl> <dbl> <dbl>
## 1 KCAE Columbia Metropolitan … Columbia 10262. 0 -100
## 2 KNSI San Nicolas Island Nol… San Nicolas Isl… 7227. 0 -100
## 3 SWJX Fazenda das Perobas Ai… Prudente De Mor… 7053. 0 -100
## 4 44PA Pennfield Farm Airport Spring Mills 7049. 0 -100
Visualizziamo la mappa dei voli nei tre mesi di Gennaio, Febbraio e Marzo 2020. Per una migliore visualizzazione della mappa è stata considerata la rete in cui ogni nodo è un aeroporto e c’è un arco tra due aeroporti se c’è stato almeno un volo ma non sono ripetuti archi se ci sono stati più voli tra due nodi.
Come cambia la mappa dei voli tra Gennaio e Marzo 2020? Mappa Gennaio 2020:
Mappa Marzo 2020:
Visualizziamo la mappa dei voli, tra Nord America e Europa e in Italia, in due date stabilite: 7 Gennaio (prima dell’inizio della pandemia) e 25 Marzo (durante la pandemia).
Voli tra Nord America a Europa del 7 Gennaio.
Voli tra Nord America a Europa del 25 Marzo. Ripetiamo la stessa analisi considerando solo i voli nazionali italiani.
Voli nazionali italiani del 7 Gennaio.
* Voli nazionali italiani del 25 Marzo.
## Componente gigante In questa rete di voli è presente una componente gigante, ovvero una componente connessa “gigante” formata da un insieme di aeroporti che sono connessi tra di loro da voli?
La componente gigante esiste ed è formata da 1.779.291 archi su 2.315.324 archi totali e da 4077 aeroporti su 5.330 aeroporti presenti nel dataset (76.5% degli aeroporti).
## aeroporto1 lat1 lon1 aeroporto2 lat2 lon2
## 1 WMKK 101.71000 2.74558 KLAX -118.408 33.94250
## 2 VHHH 113.91500 22.30890 WMKK 101.710 2.74558
## 3 YPPH 115.96700 -31.94030 KLAX -118.408 33.94250
## 4 WSSS 103.99400 1.35019 WMKK 101.710 2.74558
## 5 KCVG -84.66780 39.04880 VHHH 113.915 22.30890
## 6 EHAM 4.76389 52.30860 YPPH 115.967 -31.94030
Considerando solo i voli di gennaio la componente gigante è di 33.300 archi (su 845.899) e 3898 aeroporti.
Considerando solo i voli di marzo la componente gigante è di 31.895 archi (su 647.463) e 3769 aeroporti.
È possibile individuare delle comunità in questa rete di voli, ovvero insiemi di aeroporti che sono densamente connessi tra di loro e poco connessi con aeroporti di altre comunità? Per la ricerca di comunità sono stati applicati diversi algoritmi ed è stato scelto, per le analisi successive, quello con una modularità maggiore.
## algoritmo modularità
## 1 cluster_infomap 0.02
## 2 cluster_walktrap 0.50
## 3 cluster_louvain 0.53
## 4 cluster_label_prop 0.48
Da quanti nodi è formata la comunità più grande? La comunità più grande è formata da 2290 nodi.
## Community sizes
## 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
## 88 167 2290 566 676 82 6 8 3 1 1 2 2 2 2 2
## 17 18
## 2 2
Visualizzazione delle tre comunità più grandi nella rete dei voli di Gennaio (pre-covid).Come si può notare ci sono due comunità incentrate negli USA: in turchese la comunità più grande con 2290 nodi e in rosa la seconda comunità più grande formata da 676 nodi. Una terza comunità con 566 nodi e rappresentata dal colore corallo è centrata in Europa.
## algoritmo modularità
## 1 cluster_infomap 0.02
## 2 cluster_walktrap 0.42
## 3 cluster_louvain 0.47
## 4 cluster_label_prop 0.41
Delle 17 comunità individuate la più grande è formata da 2201 nodi.
## Community sizes
## 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
## 80 2201 615 167 83 7 587 2 1 3 13 6 2 2 2 3
## 17
## 3
Visualizzazione delle tre comunità più grandi nella rete dei voli di Marzo (durante il lockdown).Come si può notare ci sono due comunità incentrate negli USA: in turchese la comunità più grande con 2201 nodi e in rosa la seconda comunità più grande formata da 615 nodi. Una terza comunità con 578 nodi e rappresentata dal colore corallo è centrata in Europa. * Considerando i voli dei mesi di Gennaio, Febbraio e Marzo risulta che la modularità maggiore si ottiene con cluster_louvain con un valore di 0.51.
## algoritmo modularità
## 1 cluster_infomap 0.01
## 2 cluster_louvain 0.51
## 3 cluster_label_prop 0.46
L’algoritmo cluster_louvain identifica 15 comunità
## [1] 15
La comunità più grande è formata da 3091 nodi.
## Community sizes
## 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
## 113 187 3091 8 797 984 4 14 1 120 2 2 2 2 3
Visualizziamo le sei comunità più grandi nella rete. Dalla rappresentazione si nota che sono presenti due comunità negli Stati Uniti, una comunità in Europa, una comunità in Australia, una tra India e Cina e una in Sud America.
## Conclusioni